中文在线天堂а√在线,亚洲精品久久久久久下一站 ,亚洲欧洲国产色,一区二区 欧美精品 ,真人抽搐一进一出视频

/資訊中心/趨勢(shì)研究/大數(shù)據(jù)能為P2P解決哪些問(wèn)題?

大數(shù)據(jù)能為P2P解決哪些問(wèn)題?

發(fā)布時(shí)間:2014-10-14 分類(lèi):趨勢(shì)研究

作為互聯(lián)網(wǎng)金融當(dāng)中最熱門(mén)最活躍的領(lǐng)域,P2P現(xiàn)在發(fā)展速度非常快。P2P模式最早誕生于英美,它的發(fā)展主要依據(jù)兩個(gè)重大條件,一是互聯(lián)網(wǎng)技術(shù)使得交易效率提高,這個(gè)中國(guó)有;二是征信數(shù)據(jù)的廣泛適用及覆蓋,這個(gè)中國(guó)沒(méi)有。正是由于這兩條,中國(guó)P2P行業(yè)內(nèi)對(duì)于征信問(wèn)題及大數(shù)據(jù)挖掘的探討熱鬧非凡。

在中國(guó),由于征信體系不健全且不向P2P機(jī)構(gòu)開(kāi)放,這使得征信成本高昂。業(yè)界現(xiàn)在熱議大數(shù)據(jù),電子商務(wù)也好,互聯(lián)網(wǎng)金融也好,無(wú)疑都視之為一座商機(jī)無(wú)限的金礦。

那么什么是大數(shù)據(jù)?對(duì)于P2P機(jī)構(gòu)來(lái)說(shuō),大數(shù)據(jù)能夠幫助解決哪些問(wèn)題?

數(shù)據(jù)多不一定是大數(shù)據(jù)

討論大數(shù)據(jù)的第一個(gè)邏輯是,什么是大數(shù)據(jù)?簡(jiǎn)單來(lái)說(shuō),大數(shù)據(jù)指的應(yīng)該是數(shù)據(jù)很多,但為什么不叫“多數(shù)據(jù)”而叫做“大數(shù)據(jù)”?因?yàn)檫@個(gè)名稱來(lái)自英文翻譯“Big Data”。

很多的數(shù)據(jù)是否就是大數(shù)據(jù)的基礎(chǔ)?全世界最大的銀行是工商銀行(601398,股吧),全世界最大的移動(dòng)運(yùn)營(yíng)商是中國(guó)移動(dòng),工商銀行和中國(guó)移動(dòng)積累的客戶數(shù)和數(shù)據(jù)量在全世界無(wú)可比擬,它們自然有很多數(shù)據(jù),但它們是不是大數(shù)據(jù)呢?

現(xiàn)在手機(jī)是聯(lián)網(wǎng)的,但通過(guò)中國(guó)移動(dòng)查詢異地手機(jī)用戶的費(fèi)率是查不到的,它們互相之間是隔開(kāi)的,無(wú)從知道這個(gè)客戶的生活方式,如果它有這種技術(shù)手段的話,做出微信的就應(yīng)該是中國(guó)移動(dòng)而不是騰訊。

從根本上來(lái)說(shuō),簡(jiǎn)單地使很多數(shù)據(jù)堆積在一起不叫大數(shù)據(jù)。大數(shù)據(jù)主要表示一種技術(shù)手段,來(lái)使得數(shù)據(jù)的存取、分析可以非常高效進(jìn)行。首先需要技術(shù)框架,其次是分析手段。

技術(shù)框架是指,這樣的技術(shù)方式只能在現(xiàn)代環(huán)境下產(chǎn)生,比如說(shuō)云計(jì)算、云存儲(chǔ)等算法在以前是不可能實(shí)現(xiàn)的。分析手段是指,以前要么就是不具備分析工具,有數(shù)據(jù)卻算不出來(lái),要么就是分析占的時(shí)間太長(zhǎng),沒(méi)有實(shí)施的可能性,要么就是算法沒(méi)有實(shí)質(zhì)解決問(wèn)題的空間,這些隨著現(xiàn)代計(jì)算機(jī)技術(shù)的發(fā)展,網(wǎng)絡(luò)技術(shù)的發(fā)展都解決了。

除了技術(shù)框架和分析手段,更重要的是一種大數(shù)據(jù)理念。舉個(gè)例子,如果我想獲得一個(gè)房間內(nèi)每個(gè)人的身份證號(hào)碼,不同想法的人解決這個(gè)問(wèn)題的思路是什么樣的?

想象一下在傳統(tǒng)銀行工作的人會(huì)怎么解決這個(gè)問(wèn)題?他們會(huì)堵在門(mén)口說(shuō),把身份證給我看一下,確認(rèn)看了你的身份證號(hào)碼以后記下來(lái)核對(duì)你的照片,這么做費(fèi)時(shí)費(fèi)力還沒(méi)有準(zhǔn)確性。

大數(shù)據(jù)的做法是怎樣的呢?我們會(huì)給每個(gè)人發(fā)一個(gè)電腦,讓你輸入你的身份證號(hào)碼。想象一下,一個(gè)人從接到電腦以后5秒鐘就開(kāi)始輸入數(shù)據(jù),在10秒鐘之內(nèi)18位數(shù)字輸完遞交,后臺(tái)檢查正確。另外一個(gè)人,他從20秒鐘以后開(kāi)始輸入數(shù)據(jù),輸入兩個(gè)數(shù)字以后輸?shù)降谌话亚懊鎯蓚€(gè)數(shù)字刪掉,再接下來(lái)輸幾位,輸?shù)谑坏臅r(shí)候把前面十位再刪掉,再開(kāi)始輸入。運(yùn)用大數(shù)據(jù)的方法,后臺(tái)會(huì)記錄你每一個(gè)按鍵的速度、時(shí)間、屬性,我在后臺(tái)制定一套計(jì)算方法,把這個(gè)過(guò)程描述出來(lái)。從而就可以判斷哪個(gè)人的身份證號(hào)碼可能是真的,哪個(gè)人的身份證號(hào)碼可能是假的。

這個(gè)例子說(shuō)明了,大數(shù)據(jù)是一種技術(shù)手段,不是簡(jiǎn)單的數(shù)據(jù)堆積,并不是公司越大就自然而然有大數(shù)據(jù)了,也并不是說(shuō)公司小就沒(méi)有大數(shù)據(jù)。

大數(shù)據(jù)的局限性

大數(shù)據(jù)問(wèn)題的由來(lái)比較技術(shù)化,它是從概率論開(kāi)始發(fā)展,然后延伸到數(shù)理統(tǒng)計(jì)、人工智能、數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)集市。大數(shù)據(jù)現(xiàn)在最前沿的幾個(gè)技術(shù)包括,機(jī)器學(xué)習(xí)、類(lèi)型識(shí)別、神經(jīng)網(wǎng)絡(luò)。

大數(shù)據(jù)在信貸風(fēng)險(xiǎn)管理中的作用是回答兩方面的事情。

首先,大數(shù)據(jù)解決現(xiàn)狀分析,即發(fā)生了什么。這個(gè)客戶的生活方式、喜好,比如說(shuō)移動(dòng)電話上裝了可定位的設(shè)備。移動(dòng)公司可以根據(jù)定位信息知道,恰好有一批人在同一個(gè)時(shí)間點(diǎn)出現(xiàn)在一起了。它會(huì)聚集這一批人的信息,搜索你平時(shí)發(fā)表什么言論,寫(xiě)了什么樣的微信,據(jù)此判定你的職業(yè),你的任務(wù)是什么,這也就是發(fā)生了什么。

第二,大數(shù)據(jù)解決會(huì)發(fā)生什么的問(wèn)題。從信貸關(guān)系角度上看,知道你今天下午要干什么幾乎沒(méi)有意義。信貸分析、風(fēng)險(xiǎn)管理所關(guān)心的問(wèn)題是,給你一筆錢(qián)有多大的概率會(huì)不還,如果給你1萬(wàn)塊錢(qián)會(huì)怎么樣,如果給你10萬(wàn)塊會(huì)怎么樣。

基于當(dāng)今的互動(dòng)網(wǎng)絡(luò)數(shù)據(jù),個(gè)人資料其實(shí)很難被掩飾,這恰恰是說(shuō)很多互聯(lián)網(wǎng)公司或者大數(shù)據(jù)的機(jī)構(gòu)試圖說(shuō)用“知道你是誰(shuí)”來(lái)做從事商業(yè)模式的主要考慮。

在“你是誰(shuí)、你是做什么的”這些問(wèn)題得到答案之后,這時(shí)候能不能做一個(gè)信貸決策呢?這要畫(huà)一個(gè)巨大的問(wèn)號(hào)!答案是不一定的。

大數(shù)據(jù)在這個(gè)領(lǐng)域當(dāng)中回答的問(wèn)題跟征信局可以回答的問(wèn)題是不同的。傳統(tǒng)的征信局可以回答的是三個(gè)問(wèn)題——你的還款意愿、還款能力和穩(wěn)定性,這是信貸授信過(guò)程中最重要的三個(gè)問(wèn)題,可是大數(shù)據(jù)回答不了。

交易數(shù)據(jù)和社交網(wǎng)絡(luò)數(shù)據(jù)不能直接轉(zhuǎn)換為信貸決策,這個(gè)在歷史上有很多著名的案例可以證明。美國(guó)運(yùn)通曾試圖通過(guò)交易數(shù)據(jù)發(fā)行信用卡業(yè)務(wù),基于這種方式提供信貸產(chǎn)品,這造成了巨大的失敗。美國(guó)著名P2P公司Lending Club,利用Facebook的社交網(wǎng)絡(luò)數(shù)據(jù)來(lái)確定客戶的信用度,在遭受巨大的損失之后改用了征信局的數(shù)據(jù),導(dǎo)致了后來(lái)業(yè)務(wù)發(fā)生巨大的變化,壞賬率下降很多。

所以大數(shù)據(jù)有用,但是跟征信數(shù)據(jù)不一樣,它們回答的問(wèn)題是不同的。在國(guó)際上,美國(guó)和英國(guó)的征信體系相對(duì)比較完善,互聯(lián)網(wǎng)金融機(jī)構(gòu)可以向征信局購(gòu)買(mǎi)數(shù)據(jù)發(fā)起客戶營(yíng)銷(xiāo)。但在中國(guó)內(nèi)地,征信局的覆蓋是比較局限的。中國(guó)人民銀行征信數(shù)據(jù)覆蓋8億人,但是只有2.9億人有信貸記錄。由于目前征信體系尚不健全,且不對(duì)P2P機(jī)構(gòu)開(kāi)放報(bào)送和查詢數(shù)據(jù),行業(yè)首要的是解決征信覆蓋的問(wèn)題。

“Test And Learn”

顯然,大數(shù)據(jù)在互聯(lián)網(wǎng)金融領(lǐng)域已經(jīng)成為熱詞,但是如何利用對(duì)于開(kāi)采者來(lái)說(shuō),卻是“八仙過(guò)海、各顯神通”。在信而富看來(lái),“Test And Learn”,才是大數(shù)據(jù)應(yīng)用于P2P風(fēng)險(xiǎn)管理的核心方法。

“Test And Learn”,意思為“測(cè)試與獲知”,對(duì)信而富來(lái)說(shuō),意味著在放款實(shí)踐中收集數(shù)據(jù),通過(guò)建立風(fēng)險(xiǎn)模型和目標(biāo)變量,研究客戶數(shù)據(jù)與信用行為之間的關(guān)系,從而調(diào)整授信策略。

目前信而富借款人大概幾十萬(wàn)。我們?cè)诳蛻魯?shù)據(jù)分析當(dāng)中對(duì)每個(gè)借款個(gè)體采集的數(shù)據(jù)項(xiàng)超過(guò)1500個(gè),并須在“細(xì)枝末節(jié)”中尋找線索。比如,關(guān)注申請(qǐng)人的郵政編碼最近12個(gè)月是否變更,關(guān)聯(lián)的信用卡張數(shù)是否變化,最近3個(gè)月、6個(gè)月的信用卡消費(fèi)總額、交易類(lèi)別與交易次數(shù)是否出現(xiàn)異常等。這些變量構(gòu)成了信而富CDS(自動(dòng)化授信決策系統(tǒng))的重要依據(jù)。

總體來(lái)說(shuō),我們?cè)谧詣?dòng)化授信決策中主要依據(jù)幾個(gè)緯度,根據(jù)不同的借款類(lèi)型、不同的地區(qū),借款金額、借款用途等,這個(gè)緯度結(jié)構(gòu)具體組成了一個(gè)網(wǎng)狀型的決策機(jī)制。

第一個(gè)緯度是預(yù)測(cè)你還款的可能性。

第二個(gè)緯度是,你這個(gè)申請(qǐng)從根本上來(lái)說(shuō)有多大可能是假的。也許你的數(shù)據(jù)很好,看上去很漂亮,但是借款人的名字填的不是你。也就是說(shuō)你有多大可能性在你的申請(qǐng)過(guò)程中采用了假的數(shù)據(jù)。說(shuō)輕一點(diǎn)叫數(shù)據(jù)不真實(shí),更嚴(yán)格來(lái)說(shuō)叫“欺詐”。

第三個(gè)緯度是,假定借款人借給你錢(qián)以后,你所產(chǎn)生的風(fēng)險(xiǎn)調(diào)整后的收益是多少,你可以為整個(gè)交易貢獻(xiàn)多少,你可以為借給你錢(qián)的人提供多少收入。

但是數(shù)據(jù)的紛繁復(fù)雜會(huì)讓開(kāi)采者遭遇困境。在信而富設(shè)置的上千個(gè)數(shù)據(jù)緯度中,實(shí)際有用的數(shù)據(jù)可能只有100個(gè)。不同數(shù)據(jù)緯度間的邏輯關(guān)系,也很有可能產(chǎn)生沖突。不斷地測(cè)試并且獲取正確的數(shù)據(jù)維度和信息,構(gòu)成了信而富的大數(shù)據(jù)應(yīng)用的核心機(jī)密。

來(lái)源:《陸家嘴》